SSCDE: Semi-supervised canonical density estimation for automatic image annotation retrieval

نویسندگان

  • Akisato KIMURA
  • Takuho NAKANO
  • Masashi SUGIYAMA
  • Hirokazu KAMEOKA
  • Eisaku MAEDA
  • Hitoshi SAKANO
چکیده

あらまし 本論文では、与えられた画像に適切なテキストラベルを自動的に付与する画像認識 (image annotation) と、与えられたテキストラベルから適切な画像を見つけだす画像検索 (image retrievel) とを、統一的な枠組で取り 扱う画像認識検索 (image annotation retrieval) 問題を取り上げる。この問題に対し、我々は、画像とラベルとの関 係性を表現するトピックモデルを半教師的にかつ簡易に獲得できる新しい機械学習手法 SSCDE (Semi-supervised canonical density estimation) を提案する。提案手法は以下の 2つの要素から構成される。(1) 独自に開発した半教師 型正準相関分析 (SemiCCA)により、従来の正準相関分析と同等の計算量で、少数のラベル付画像から得られる画像 とラベルとの共起情報と、大量のラベルなし画像から得られる大域的な分布構造との双方を同時に考慮した線形潜在 変数空間を獲得する。 (2) カーネル密度推定を用いた半教師付事後確率推定法 SSKDEを多重ラベル分類問題に適用 し、潜在変数空間に内在する非線形性・非ガウス性を事例ベースに取り込む。本手法は、単なる半教師付学習手法の 提案としての意味だけでなく、一般の画像認識検索の問題を云わば特定トピック認識問題として捉え直す、新しいパ ラダイムをも提供し得る。PASCAL VOCデータセットを用いた実験により、ラベル付画像が少数しかない状況下で も、大量のラベルなし画像を活用して認識精度を大幅に向上できることを示す。 キーワード 画像認識検索、半教師付学習、トピックモデル、正準相関分析、カーネル密度推定、事例ベース

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Automatic Audio Tagging and Retrieval Using Semi-Surpervised Canonical Density Estimation

We apply SSCDE (semi-supervised canonical density estimation), a semi-supervised learning method based on topic modeling, to audio tagging and retrieval problems. SSCDE was originally proposed as an image annotaion and retireval method, but it can also be applied to audio data. The SSCDE method consists of two parts: 1) extraction of a low-dimentional latent space representing topics of sounds ...

متن کامل

Fuzzy Neighbor Voting for Automatic Image Annotation

With quick development of digital images and the availability of imaging tools, massive amounts of images are created. Therefore, efficient management and suitable retrieval, especially by computers, is one of themost challenging fields in image processing. Automatic image annotation (AIA) or refers to attaching words, keywords or comments to an image or to a selected part of it. In this paper,...

متن کامل

Semi-supervised kernel density estimation for video annotation

Insufficiency of labeled training data is a major obstacle for automatic video annotation. Semi-supervised learning is an effective approach to this problem by leveraging a large amount of unlabeled data. However, existing semi-supervised learning algorithms have not demonstrated promising results in largescale video annotation due to several difficulties, such as large variation of video conte...

متن کامل

SemiCCA: Ef cient semi-supervised learning of canonical correlations

—Canonical correlation analysis (CCA) is a powerful tool for analyzing multi-dimensional paired data. However, CCA tends to perform poorly when the number of paired samples is limited, which is often the case in practice. To cope with this problem, we propose a semi-supervised variant of CCA named “semiCCA”that allows us to incorporate additional unpaired samples for mitigating over ttng. The p...

متن کامل

Hierarchical sparse representation for object recognition

Recently, generic object recognition that achieves human-like vision has being looked to for use in robot vision, automatic categorization of images, and image retrieval. In object recognition, semi-supervised learning, which incorporates a large amount of unsupervised training data (unlabeled data) along with a small amount of supervised data (labeled data), is regarded as an effective tool to...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2010